Trabajo final de ingeniería genética de microorganismosCaracterización de la secuencia 4 del cromosoma de Rhodoccocus sp.

R.Bayarri Olmos


Trabajo elaborado, poca bibliografía, la ORF elegida no es correcta

RESUMEN
En el presente trabajo se estudió una secuencia determinada de 17.000 pb del genoma de Rhodoccocus
(los nombres de especies se subrayan o se escriben en cursiva) sp., y la caracterización de una de las proteínas codificadas en esa región. Tras esto, se realizó una mutación dirigida y la fusión a la proteína GFP , así como a un tag para facilitar su identificación.

INTRODUCCIÓN
El nombre del género Rhodococcus fue propuesto Goodfellow y Alderson (1) en un estudio de clasificación por taxonomía numérica. R. rhodochrous fue propuesto como la especie tipo. El género lo integran además ocho especies: R. bronchialis, R. coprophilus, R. corallinus, R. erythropolis, R. equi, R. rhodnii, R. ruber, R. rubropertinctus y R. terrae. Estas bacterias exhiben un amplio rango de actividades metabólicas (2). Tras un análisis bioinformático, fuimos descartando especies,hasta identificar nuestro microorganismo como R. sp.

MATERIALES Y MÉTODOS
Cepas bacterianas y plásmidos
En este estudio hemos utilizado cepas de Rhodoccocus que crecimos a 28º en caldo de soja, en caldo de agar, o en "minimal salts thiamine medim",y cepas de
E.Coli crecidas a 37ºC en caldo de Luria o en agar de luria.
Para realizar las mutaciones de nuestro gen, utilizamos el plásmido pBL1
(referencia) al que introducimos el gen kan para seleccionar las colonias transformantes (pULRS6).(referencia)
Obtención y cultivo de la cepa
Obtuvimos la cepa a partir de la toma de un elevado número de muestras de suelo el cauce del río bernesga
(Bernesga) , y realizamos la selección en un medio sólido con vapores de una mezcla de hidrocarburos (si no dice algo en la introducción, no se entiende porque ha preparado ese medio) (hexano, heptano e iso-octano). Para el aislamiento se utilizó un medio con la siguiente composición: sulfato de magnesio 0,2 g, cloruro cálcico 0,02 g, fosfato monopotásico 1 g, fosfato dipotásico 1 g, nitrato amónico 1 g, cloruro férrico 0,05 g, agar-agar 15 g, y atmósfera de hexano:heptano:iso-octano (1:1:1) en bolsas de polipropileno herméticamente selladas. Con suficiente cantidad de oxígeno para desarrollo aeróbico (aproximadamente 200 ml).
Análisis de datos Hemos llevado a cabo un seguimiento bioinformático de todas las etapas de nuestro experimento. Los diferentes programas utilizados serán explicados en sus correspondientes apartados.


PROCEDIMIENTO


La primera parte de nuestra investigación, consistió en idetificar la posición ocupada por nuestro microorganismo en árbol filogenético.
Primero aislamos el ADN tratando primro la pared con lisozima y SDS. A continuación, disociamos las proteínas del ADN con proteasas y agentEs coatrópics, procurando de no dañar nuestro ADN. Después de elimiar las proteínas y el ARN, concentramos el ADN.
A continuación, tomamos varias muestras del genoma de nuestro microorganismo, y realizamos PCR para coseguir sondas de ADN.
Con estas, utilizamos un microarray de ARNr de una gran variedad de microorganismos, con lo que conseguimos identificar el nuestro como Rhodoccocus sp. y establecer lasdistancias genéticas con las demás especies. (esto no se entiende, y no parece tenerlo claro)

1.- Microorganismo del cual procede la secuencia.


arbol_filogenetico_asisi.jpg

2.- Análisis informático de la secuencia mediante el programa ARTEMIS

Una vez identificada la posición filogenética ocupada por nuestro organismo, procedimos a analizar nuestra secuencia de 17.000 pb.
Comenzamos localizando los distintos ORFs con el programa Artemis, y analizándolos uno por uno mediante el programa blast del NCBI.
Los resultados fueron los siguientes:
45 ORFs en la cadena directa y 39 en la cadena inversa. De todos ellos, los siguientes tenían un prodecto génico identificado:

ORF 1
Localización (en bases): 2-3049
Codifica para: Glutamato sintasa subunidad grande y subunidad beta

ORF 2
Localización: 3773-4702
Codifica para: Subunidad pequeña de la glutamato sintasa

ORF 3
Localización: 12062-12937
Codifica para: Proteína hipotética

ORF 4
Localización: 12938-13741
Codifica para: Deshidogenasa putativa de unión al FAD /proteína hipotética

ORF 5
Localización: 12221-14437 en la cadena inversa
Codifica para: Un regulador transcripcional putativo de la familia TetR

ORF 6
Localización: 13949-14359
Codifica para: Regulador trascripcional en el microorganismo Saccharopolyspora erythraea
Este último ORF lo he tenido en cuenta debido a lo curioso de esa región, ya que presenta una gran homología con el gen de Saccharopolyspora pero, sin embargo, el programa blast no le encontró similitudes con ninguna región de Rhodoccocus .


De todos estos ORFs, seleccionamos el gen que puede codificar para la Deshidogenasa putativa de unión al FAD o para una proteína hipotética.
ORF 4:
Score = 606 bits (328), Expect = 2e-170
Identities = 668/825 (80%), Gaps = 51/825 (6%)
Strand=Plus/Minus

Secuencia de nucleótidos en formato FASTA:

GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CACCAGGAACAGGCCGCCGAGTGA
Secuencia de aminoácidos en formato FASTA:


Esta ORF no está bien analizada. REQ530

ALSGGVEPQRRRAGDDPDGVIGPDRVPVDDALGVVPHAIPVDDVAARVLGDLEHAAVHVR
GHAGDHVLGHTAQAVDGPVLLHEVGVAADAAGGHHHGLRAEFELADGRAGRLHAARFGRR
LEHRAAHPHGGAVLDDQIVHLVPVSEGDLSAGGGVEHRFAEHPDHFRSRAPRDVEARYRI
SVTGGQPTAAFGPADVRHHAQAEVVQVGPLLAGREVDVGLGPLPGPTVFAVAVESGAAQP
VLQRQFTGVLDAHAALLGAVHQEQAAE



3.- Análisis del gen que codifica para la proteína elegida


Diseño de primers para la amplificación del gen/es por PCR


Realizamos los primers "manualmente" y luego comprobamos su validez mediante el programa Primer3 :
Primer izquierdo 5'-GCGCTTTCCGGTGGCGTC-3'

Primer derecho 5'- TCACTCGGCGGCCTGTTCCT -3'

Al probarlos con el PRIMER3, nos dá un aviso de que no es recomendable el uso de estos 2 primers debido a que possen Tm demasiado altas y que el primer izq. tiene una alta estabilidad 3'. Después de probar todos los tamaños de primers posibles para amplificar la totalidad de la secuencia, escogimos la pareja con una Tm menor y más parecida y que no presentase complementariedad de bases.



Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
1
18
69.68
72.22
4.00
2.00
GCGCTTTCCGGTGGCGTC
Primer derecho
804
20
69.75
69.75
5.00
0.00
TCACTCGGCGGCCTGTTCCT
Tamaño de la secuencia: 804 pb
Tamaño incluído entre los primers: 804pb
Complementariedad entre primers: 4.00
Complementariedad del extremo 3': 0.00

Si queremos estudiar el gen, podemos crear primers que incluyan puntos de corte para enzimas de restricción que también corten en el plásmido, de firma que lo podamos introducir y ver como se expresa en nuestro microorganismo:
Primer izquierdo: 5'- CCCAAGCTTGGG GCGCTTTCCGGTGGCGTC (HindIlI)
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
La enzima que reconoce la diana añadida al primer, no corta en el interior de nuestra secuencia, pero sí en el plásmido utilizado (pUL340, un vector de clonación en Corinebacterias).



Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.


Volvemos a utilizar el programa Primer3 para diseñar primers, esta vez, que peritan amplifica secuencias internas:


Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
230
20
58.99
55.00
4.00
2.00
GGCCAGTTCTTCTTCACGAG
Primer derecho
448
20
58.87
55.00
7.00
2.00
ACAGGTCACCTTCCGATACC
Tamaño amplificado: 214 pb
Esta es la pareja más favorable. El programa, además, te calcula otros primers que también pueden ser usados para amplificr fagmentos internos, pero de diferente tamaño. Por ejemplo:
Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
69
19
59.91
57.89
5.00
2.00
AGATCGGGTCCCAGTTGAC
Primer derecho
254
20
58.84
55.00
4.00
0.00
CCGACCTCGTGAAGAAGAAC
Tamaño amplificado: 186 pb


Búsqueda informática de promotores, terminadores, secuencias señal…


Valiéndonos de distintas herramientas bioinformáticas, facilitadas por la Queen's university, analizamos la secuencia de nuestro gen, obteniendo la siguiente información:

Promotores

Score
Description

72

Position:
9
Strand:
+
Sequence:
GTGGCGTGCGCTTTCCG
Locus:
1

72

Position:
494
Strand:
-
Sequence:
GTGGTCCGGGTGTTCCG
Locus:
1

71

Position:
173
Strand:
-
Sequence:
GTGGACGGCCGCATGCT
Locus:
1

71

Position:
635
Strand:
+
Sequence:
TAGGCCCGCTTCTCGCC
Locus:
1

70

Position:
536
Strand:
-
Sequence:
TCGGTACCGCGCTTCCA
Locus:
1

69

Position:
234
Strand:
-
Sequence:
CTGGCCCGTCGACCGCC
Locus:
1

69

Position:
376
Strand:
-
Sequence:
GCGGCACGGTGCTCGAG
Locus:
1

69

Position:
616
Strand:
+
Sequence:
CAGGCCGAGGTCGTGCA
Locus:
1

Tuvimos que disminuir manualmente la precisión del análisis , y escogimos un valor límite de 69, ya que a partir de él, se producía una caída drástica de la puntuación de los posibles promotores.
El programa utilizado fue el PromScan. Al cotejar los resultados con el programa BProm de Softberry, en el cual no te deja ajustar su precisión y especifidad (por defecto, el 80%), no encontramos promotores.
De todos ellos, nos quedaríamos con el promotor de la primera posición (9), y a lo sumo, con el que ocupa la posicion 173.
Debería haber señalado en la secuencia dónde se encuentra el promotor


Terminadores

Para al búsqueda bioinformática de terminadores, utilizamos el programa TransTermHP, que realiza predicciones sobre la localización de terminadores en los microorganismos de su base de datos. Debido a que el genoma de Rhodococcus no está disponible para realizar el estudio de terminadores (eso no es una excusa, el terminador se encuentra en la secuencia que le he proporcionado, o no ha entendido el concepto) , utilizamos el microorganismo más próximo fiogeneticamente, Nocardia farcinina y utilizamos sus datos.
Debido a que no disponíamos de mejores herramientas, tuvimos que realizar la búsqueda manual de los terminadores en la secuencia pra nuestra proteína, pero no obtuvimos ningún resultado favorable.


4.- Análisis de la/s proteína/s elegida/s


Diseño de primers para amplificar los genes que codifican para la proteína de interés con colas de histidina para su rápida purificación

Introduciremos nuestro Tag en el extremo 5' de la proteína:

Primer izquierdo: 5'- CCCAAGCTTGGG ATG CGCCGCCGCCGCCGCCGC GCGCTTTCCGGTGGCGTC
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT

En el primer izquierdo hemos introducido el codón de inicio antes de la secuencia que codifica para His6 (una cola de 6 residuos de histidina), en color azul.
Para el primer derecho hemos respetado su estructura, sin añadirle ningún codón de terminación, pues ya viene en nuestra proteína.
Hemos utilizado las sec. diana de la enzima HindIII, que sólo posee un sitio de corte en el plásmido (lugar en el que se insertará nuestra construcción), por lo que podremos hacer un screening rápido de nuestro gen.

Estudio de la proteína por bioinformática (dominios conservados, hidrofobicidad, estructura, características bioquímicas…..)

Características fisico-químicas

Número de aminoácidos: 267
Peso molecular: 27668.7
PI: 5.82
Composición de aminoácidos:
Ala (A) 43 16.1%
Arg (R) 22 8.2%
Asn (N) 0 0.0%
Asp (D) 21 7.9%
Cys (C) 0 0.0%
Gln (Q) 11 4.1%
Glu (E) 15 5.6%
Gly (G) 35 13.1%
His (H) 22 8.2%
Ile (I) 4 1.5%
Leu (L) 22 8.2%
Lys (K) 0 0.0%
Met (M) 0 0.0%
Phe (F) 7 2.6%
Pro (P) 18 6.7%
Ser (S) 6 2.2%
Thr (T) 5 1.9%
Trp (W) 0 0.0%
Tyr (Y) 1 0.4%
Val (V) 35 13.1%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%

(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%

Número total de residuos cargados negativamente (Asp+Glu): 36
Número total de residuos cargados positivamente (Arg+Lys): 22

Composición atómica:
Carbon C 1208
Hydrogen H 1902
Nitrogen N 388
Oxygen O 363
Sulfur S 0

Coeficiente de extinción: 1490 (medido a 280nm en agua).
Esta proteína no contiene residuos Trp, lo que puede llevar a un error de más del 10% en el cálculo del coeficiente de extinción (M-1 cm-1).
Abs 0.1% (=1 g/l) 0.054, assuming ALL Cys residues appear as half cystines

Vida media estimada: 4.4 horas (reticulocitos in vitro).
>20 horas (levaduras, in vivo).
>10 horas (Escherichia coli, in vivo).

Índice de inestabilidad: 25.50
Con este valor, consideramos la proteína como estable.

Índice alifático: 92.10

Motivos de la proteína (despues de todo esto, qué conclusión saca de esta proteína?)

El programa motifScan nos permite acceder a distintas bases de datos desde las que identificar los diferentes motivos de nuestra proteína.
Los distintos motivos quedan recogidos en el siguiente mapa:
match_map.jpg
A continuación, se encuentra una vista más detallada de los mismos. El orden se corresponde con el mostrado en el mapa.
motivos.jpg

Hidrofobicidad
Para calcular este parámetro, utilizamos el programa Protscale., el cual te permite calclar y representar el perfil producido por cualquier "escala de aminoácidos" en la proteína seleccionada. Una escala de aminoácido se define por un valor numérico asignado a cada aminoácido. En nuestro caso, utilizamos la escala de hidrofobicidad de Kyte & Doolittle.
Los valores de los aminoácidos son los que siguen:
Ala:  1.800  Arg: -4.500  Asn: -3.500  Asp: -3.500  Cys:  2.500  Gln: -3.500
Glu: -3.500  Gly: -0.400  His: -3.200  Ile:  4.500  Leu:  3.800  Lys: -3.900
Met:  1.900  Phe:  2.800  Pro: -1.600  Ser: -0.800  Thr: -0.700  Trp: -0.900
Tyr: -1.300  Val:  4.200  : -3.500  : -3.500  : -0.490
 
 
Reprentación de la escala de hidrofobicidad de Kyte & Doolittle:
perfil_de_hidrofobicidad.gif
Familia
Según de que fuente obtengamos la secuencia, el programa Pfam nos da un resultado u otro. Con la secuancia de aminoácidos obtenida con el ARTEMIS, el Pfam no encuentra ninguna familia (eso es la prueba de que no ha utilizado bien Arttemis y ha elegido un ORF no correcto) . Si tomamos el prouct génico desde lso resultados del ncbi, obtenemos que pertenece a la "FAD binding domain".
Esta familia incluye las subunidades flavoproteina de las fumarato y succinato deshidrogenasa, aspartato oxidasa y la subunidad alfa de la adenililsulfato reductasa.
En bacterias hay 2 grupos diferenciados; proteínas unidas a membrana y complejos enzimaticos responsables de la interconversión de fumarato y succinato: fumarato reductasa (Frd), usada en el crecimiento anaeróbico, y la succinato deshidrogenasa (Sdh), usada en el crecimiento aeróbico. Ambos complejos están formados por dos componentes principales: un componente extrínseco de membrana, compuesto por una flavoproteína de unión al FAD y un proteína de hierro-azufre; y un componente hidrofóbico compuesto de una proteína de anclaje a la membrana y/o un citocromo B.
La subunidad flavoproteína es una proteina de unos 60 a 70 kd, en la cual el FADestá unido covalentmente a un residuo de histidina localizado en la sección N-terminal de la proteína PUBMED:2668268.La secuencia de los alrededores de la histidina esá bien conservada en Frd y Sdh en numerosas especias bacterianas y eucariotas PUBMED:1375942.
Esta familia es miembro del clan NADP_Rossmann (CL0063).
Localización celular

Para localizar nuestra proteína utilizamos el programa PsortB, obteniendo que es una proteína citoplasmática:
Localization Scores:
Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Debido a sólo ha podido encontrar unas pocas regiones identificativas de la posición en nuestra secuencia, comprobaremos los resultados buscando posibles péptidos señal y dominios trasmembrana:

Péptido señal

El análisis lo hemos realizado online con el Signal 3.0. La primer gráfica corresponde a un análisis de "neural networks" (NN), y la segunda a "hidden Markov models" (HMM):

peptido_señal_2.jpg
peptido_señal_2.jpg
Dominios transmembrana

Como podíamos esperar, después de realizar el análisis, comprobamos que no posee dominios transmembrana, por lo que afirmamos que se trata de una proteína citoplasmática.
dominios_transmembrana.jpg

Mutagénesis in vitro del gen que codifica para la proteína elegida.


GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
CGCGAAAGGCCACCGCAGCTCGGTGTCGCTGCTGCCCGGCCCCTACTAGGCCTACCGCAC

ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
TAGCCCGGTCTAGCCCAGGGTCAACTGCTACGGGAGCCACATCACGGTGTACGCTAGGGC


GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
CAACTGCTACAACGGCGGGCGCAAGAGCCACTAGAGCTCGTACGCCGGCAGGTGCACGCG


GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CCCGTGCGGCCACTAGTACACGAGCCCGTGTGCCGGGTCCGCCAGCTGCCCGGTCAAGAA


CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAAGTGCTCCAGCCCCAACGGCGGCTACGGCGGCCTCCAGTGGTGGTGCCGGACGCGCGC

GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCAAGCTTGAGCGGCTGCCCGCACGCCCTGCTGAAGTGCGGCGCGCCAAGCCAGCTGCC


CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
GAGCTCGTGGCACGGCGCGTGGGGGTGCCGCCGCGGCAAGAGCTGCTAGTCTAGCAGGTG


CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GACCACGGCCATAGCCTTCCACTGGACAGGCGCCCGCCGCCGCAGCTCGTGGCCAAGCGC


GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
CTTGTGGGCCTGGTGAAGGCCAGGGCACGGGGTGCACTACACCTTCGCGCCATGGCTTAA


TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
AGGCACTGGCCACCGGTCGGGTGGCGGCGCAAGCCGGGTCGGCTGCAAGCCGTAGTGCGC


CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GTCCGGCTCCAGCACGTCCATCCGGGCGAAGAGCGGCCGGCGCTTCAGCTGCATCCGGAG


GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
CCGGGTGACGGCCCCGGTTGCCAGAAGCGCCAGCGCCAGCTTAGGCCGCGACGGGTCGGT


GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CAGGACGTCGCGGTCAAGTGCCCTCAGGAACTACGGGTACGCCGCGACGAGCCCCGACAG


CACCAGGAACAGGCCGCCGAGTGA
GTGGTCCTTGTCCGGCGGCTCACT

Primer 1: GCGCTTTCCGGTGGCGTC
Primer 2: GGCCACTTCTTCTTCACGAG
Primer 3: CTCGTGAAGAAGAAGTGGCC
Primer 4: TCACTCGGCGGCCTGTTCCT

Realizamos la mutación en el codón GTT, que codifica para el aminoácido alifático Valina, sustituyendo la G por la C, por lo que ahora pasará a codificar para la leucina, otro aminoacido alifático. Hemos realizado una mutación conservativa utilizando primers que presentan "missmatch".


Diseño de primers para realizar fusiones génicas entre la proteína de interés con la proteína fluorescente verde para estudiar su localización celular o su concentración a lo largo del crecimiento del microorganismo.


GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
CGCGAAAGGCCACCGCAGCTCGGTGTCGCTGCTGCCCGGCCCCTACTAGGCCTACCGCAC

ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
TAGCCCGGTCTAGCCCAGGGTCAACTGCTACGGGAGCCACATCACGGTGTACGCTAGGGC


GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
CAACTGCTACAACGGCGGGCGCAAGAGCCACTAGAGCTCGTACGCCGGCAGGTGCACGCG


GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CCCGTGCGGCCACTAGTACACGAGCCCGTGTGCCGGGTCCGCCAGCTGCCCGGTCAAGAA


CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAAGTGCTCCAGCCCCAACGGCGGCTACGGCGGCCTCCAGTGGTGGTGCCGGACGCGCGC

GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCAAGCTTGAGCGGCTGCCCGCACGCCCTGCTGAAGTGCGGCGCGCCAAGCCAGCTGCC


CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
GAGCTCGTGGCACGGCGCGTGGGGGTGCCGCCGCGGCAAGAGCTGCTAGTCTAGCAGGTG


CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GACCACGGCCATAGCCTTCCACTGGACAGGCGCCCGCCGCCGCAGCTCGTGGCCAAGCGC


GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
CTTGTGGGCCTGGTGAAGGCCAGGGCACGGGGTGCACTACACCTTCGCGCCATGGCTTAA


TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
AGGCACTGGCCACCGGTCGGGTGGCGGCGCAAGCCGGGTCGGCTGCAAGCCGTAGTGCGC


CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GTCCGGCTCCAGCACGTCCATCCGGGCGAAGAGCGGCCGGCGCTTCAGCTGCATCCGGAG


GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
CCGGGTGACGGCCCCGGTTGCCAGAAGCGCCAGCGCCAGCTTAGGCCGCGACGGGTCGGT


GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CAGGACGTCGCGGTCAAGTGCCCTCAGGAACTACGGGTACGCCGCGACGAGCCCCGACAG


CACCAGGAACAGGCCGCCGAGTGA
GTGGTCCTTGTCCGGCGGCTCACT



Secuencia del gen GFP
ATGAGTAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATG 0
TACTCATTTCCTCTTCTTGAAAAGTGACCTCAACAGGGTTAAGAACAACTTAATCTACCACTACAATTAC 0

GGCACAAATTTTCTGTCAGTGGAGAGGGTGAAGGTGATGCAACATACGGAAAACTTACCCTTAAATTTAT 70
CCGTGTTTAAAAGACAGTCACCTCTCCCACTTCCACTACGTTGTATGCCTTTTGAATGGGAATTTAAATA 70

TTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTTTCGGTTATGGTGTTCAATGC 140
AACGTGATGACCTTTTGATGGACAAGGTACCGGTTGTGAACAGTGATGAAAGCCAATACCACAAGTTACG 140

TTTGCGAGATACCCAGATCATATGAAACAGCATGACTTTTTCAAGAGTGCCATGCCTGAAGGTTATGTAC 210
AAACGCTCTATGGGTCTAGTATACTTTGTCGTACTGAAAAAGTTCTCACGGTACGGACTTCCAATACATG 210

AGGAAAGAACTATATTTTTCAAAGATGACGGGAACTACAAGACACGTGCTGAAGTCAAGTTTGAAGGTGA 280
TCCTTTCTTGATATAAAAAGTTTCTACTGCCCTTGATGTTCTGTGCACGACTTCAGTTCAAACTTCCACT 280

TACCCTTGTTAATAGAATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTTGGACACAAA 350
ATGGGAACAATTATCTTAGCTCAATTTTCCATAACTAAAATTTCTTCTACCTTTGTAAGAACCTGTGTTT 350

TTGGAATACAACTATAACTCACACAATGTATACATCATGGCAGACAAACAAAAGAATGGAATCAAAGTTA 420
AACCTTATGTTGATATTGAGTGTGTTACATATGTAGTACCGTCTGTTTGTTTTCTTACCTTAGTTTCAAT 420

ACTTCAAAATTAGACACAACATTGAAGATGGAAGCGTTCAACTAGCAGACCATTATCAACAAAATACTCC 490
TGAAGTTTTAATCTGTGTTGTAACTTCTACCTTCGCAAGTTGATCGTCTGGTAATAGTTGTTTTATGAGG 490

AATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCCACACAATCTGCCCTTTCGAAAGAT 560
TTAACCGCTACCGGGACAGGAAAATGGTCTGTTGGTAATGGACAGGTGTGTTAGACGGGAAAGCTTTCTA 560

CCCAACGAAAAGAGAGACCACATGGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTACACATGGCATGG 630
GGGTTGCTTTTCTCTCTGGTGTACCAGGAAGAACTCAAACATTGTCGACGACCCTAATGTGTACCGTACC 630

ATGAACTATACAAATAA 717
TACTTGATATGTTTATT 717




Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
Primer 1: 5'- CCCAAGCTTGGG ATG GCGCTTTCCGGTGGCGTC
Primer 2: 5'- CTCCTTTACTCATCTCGGCGGCC
Primer 3: 5'- GGCCGCCGAGATGAGTAAAGGAG
Primer 4: 5'- AACTGCAGAACCAATGCATTGG AATAAACATATCAAGTAGGTACGG (PstI)
Nota: Las dianas de las enzimas de restricción se encuentras subrayadas y flanqueadas por las bases necesarias para que se produca el corte.


BIBLIOGRAFIA
(no se puede escribir un trabajo en el 2009 usando una bibliografía anticuada) No ha utilizado los programas indicados para la bibliografía.
1. Goodfellow M, Alderson G (1977) The actinomycete-genus Rhodococcus: a home for the 'rhodochrous' complex. J. Gen. Microbiol. 100: 99-122.
2. Warhurst AM, Fewson CA (1994) Biotransformations catalyzed bythe genus
hodococcus. Crit. Rev. Biotechnol. 14: 29-73.